1.5G数据集 | 200万条Indiegogo众筹项目信息
Indiegogo
Indiegogo成立于2008年,全球最大的科创新品首发和众筹平台, 是美国最早的众筹平台之一。
参考论文
该数据集研究价值,可用于研究市场营销、创新创业、信息管理等, 部分使用众筹数据集作为研究对象的论文。
[1]王伟,陈伟,祝效国,王洪伟. 众筹融资成功率与语言风格的说服性-基于Kickstarter的实证研究.管理世界.2016;5:81-98. [2]Dai, Hengchen and Dennis J. Zhang. “Prosocial Goal Pursuit in Crowdfunding: Evidence from Kickstarter.” Journal of Marketing Research 56 (2019): 498 - 517. [3]Gafni, H., Marom, D.M., Robb, A.M., & Sade, O. (2020). Gender Dynamics in Crowdfunding (Kickstarter): Evidence on Entrepreneurs, Backers, and Taste-Based Discrimination*. Review of Finance. [4]Jensen, Lasse Skovgaard and Ali Gürcan Özkil. “Identifying challenges in crowdfunded product development: a review of Kickstarter projects.” Design Science 4 (2018): n. pag.
Indiegogo数据
2016年4月写好的Indiegogo爬虫,每月执行一次,
最新的数据 可以前往https://webrobots.io/indiegogo-dataset/
‘原始’数据
Web Robot网上公开的的Indiegogo原始数据几十个 csv文件,
整理
大邓将上图的zip全部合并为一个 Indiegogo_dataset.csv , 该文件 1.57G 。
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
dff = pd.read_csv('Indiegogo_Dataset/Indiegogo_dataset.csv', on_bad_lines='skip')
dff.head()
Run
数据集的字段有
df.columns
Run
Index(['bullet_point',
'category', 'category_url', #项目类目及url
'clickthrough_url', #进入当前项目经由的某url
'close_date', #项目截止日期
'currency', #货币
'funds_raised_amount', #当前已筹集的资金
'funds_raised_percent', #筹集资金进度(当前筹资/项目目标金额)
'image_url', #图片url
'is_indemand',
'is_pre_launch', #是否为预演
'offered_by', #项目发起人
'open_date', #项目开始日期
'perk_goal_percentage', 'perks_claimed',
'price_offered', #众筹价
'price_retail', #零售价
'product_stage', #产品阶段
'project_id', #项目id
'project_type', #项目类型
'source_url', #项目url
'tagline', 'tags', #标签
'title' ], #项目标题
dtype='object')
数据获取
原始数据 https://webrobots.io/indiegogo-dataset/ 整理的1.57G csv, https://hidadeng.github.io/blog/2022-12-08-indiegogo-dataset/
精选文章
FinBERT | 金融文本BERT模型,可情感分析、识别ESG和FLS类型
JM2022综述 | 黄金领域: 为营销研究(新洞察)采集网络数据
27G数据集 | 使用Python对27G招股说明书进行文本分析
PNAS | 使用语义距离测量一个人的创新力(发散思维)得分
安装python包出现报错:Microsoft Visual 14.0 or greater is required. 怎么办?